課程名稱 |
資料科學中的統計推論 Statistical Inference in Data Science |
開課學期 |
110-1 |
授課對象 |
公共衛生學院 公共衛生學系 |
授課教師 |
王彥雯 |
課號 |
PH0015 |
課程識別碼 |
801 00140 |
班次 |
|
學分 |
3.0 |
全/半年 |
半年 |
必/選修 |
選修 |
上課時間 |
星期二7,8,9(14:20~17:20) |
上課地點 |
公衛211 |
備註 |
公衛系生物統計與健康資訊模組必修。與蕭朱杏合授 限本系所學生(含輔系、雙修生) 總人數上限:30人 |
Ceiba 課程網頁 |
http://ceiba.ntu.edu.tw/1101PH0015 |
課程簡介影片 |
|
核心能力關聯 |
核心能力與課程規劃關聯圖 |
課程大綱
|
為確保您我的權利,請尊重智慧財產權及不得非法影印
|
課程概述 |
本課程將針對在資料科學時代,統計方法的理論背景與架構進行介紹,讓學生了解統計推論是如何進行的,內容將涵蓋機率、隨機變數、分配、估計、檢定等內容之基礎理論。有別於以往類似課程以數學推理證明為主,本課程將利用電腦軟體進行數據模擬實驗,以實際操作方式讓學生體會統計推論背後的理論架構。 |
課程目標 |
了解統計推論的原理。 |
課程要求 |
修課同學須具備微積分與基礎統計學的相關知識。 |
預期每週課後學習時數 |
|
Office Hours |
每週一 11:00~12:00 備註: 需要office hour的同學,可以在這個時段與助教約。 |
指定閱讀 |
Rice, J. A. (2007). Mathematical Statistics and Data Analysis, 3rd edition. Cengage Learning. |
參考書目 |
1. Matloff, N. (2019). Probability and Statistics for Data Science: Math + R + Data, CRC.
2. Efron, B. and Hastie, T. (2016). Computer Age Statistical Inference: Algorithms, Evidence and Data Science. Cambridge.
|
評量方式 (僅供參考) |
No. |
項目 |
百分比 |
說明 |
1. |
平時表現、課堂參與 |
20% |
|
2. |
作業練習 |
20% |
|
3. |
期中考 |
30% |
|
4. |
期末考 |
30% |
|
|
週次 |
日期 |
單元主題 |
第1週 |
9/28 |
1. 課程介紹
2. 機率概念(王彥雯老師) |
第2週 |
10/05 |
1. 隨機變數:離散與連續隨機變數概念介紹
2. 分配:認識離散與連續機率分配(王彥雯老師) |
第3週 |
10/12 |
獨立隨機變數、條件機率分配、聯合機率分配(王彥雯老師) |
第4週 |
10/19 |
期望值I:期望值、變異數與標準差、共變異數與相關係數(王彥雯老師) |
第5週 |
10/26 |
期望值II:條件期望值與預測、動差生成函數、近似方法(王彥雯老師) |
第6週 |
11/02 |
極限定理:大數法則、分布收斂、中央極限定理(王彥雯老師) |
第7週 |
11/09 |
抽樣:母體與樣本、抽樣方法、估計(王彥雯老師) |
第8週 |
11/16 |
期中考(王彥雯老師) |
第9週 |
11/23 |
參數估計方法I:參數估計、動差估計法(蕭朱杏老師) |
第10週 |
11/30 |
參數估計方法I:最大概似估計法(蕭朱杏老師) |
第11週 |
12/07 |
參數估計方法II:貝氏估計法、有效性與Cramér-Roa lower bound、充分性
假設檢定與適合度評估:Neyman-Pearson paradigm、信賴區間與假設檢定、likelihood ratio檢定(蕭朱杏老師 |
第12週 |
12/14 |
資料統整:統計圖、資料中心點的測量、資料離散程度的測量、與累積機率密度函數相關之方法(蕭朱杏老師) |
第13週 |
12/21 |
兩組樣本的比較:比較兩獨立樣本、比較相依樣本、實驗設計(蕭朱杏老師) |
第14週 |
12/28 |
變異數分析(蕭朱杏老師) |
第15週 |
1/04 |
類別資料分析:Fisher’s exact test、卡方檢定、配對資料分析、勝算比(蕭朱杏老師) |
第16週 |
1/11 |
期末考(蕭朱杏老師) |
第17週 |
1/18 |
教師彈性補充教學:專題演講 |
|